查看原文
其他

技术饭 | 朱亚东:AI 赋能商业化

朱亚东 Mobvista汇量科技 2019-08-14

刚刚过去的 2017年,被称为人工智能发展的“应用元年”,人工智能正在全球范围内加速渗透金融、汽车、医疗、安防、消费等各大传统行业,数字广告作为互联网的核心商业化手段更是 AI 应用的前沿阵地。


AI 的早期押注者们主要投入在数据分析、算法领域,Mobvista 也一样,我们在去年 12 月迎来朱亚东博士的加入,他担任集团副总裁,进一步明确了 AI 赋能商业化的整体布局:在公司传统强项的基础上,逐步形成新的商务、产品、技术——三位一体的战略拼图,持续在世界范围内与行业一流公司正面竞争。


这篇长文即是朱亚东对这一布局的详细阐述。


剥除泡沫和人云亦云、经过时间沉淀后,AI 领域的真正思考和探讨在 2018 年得以显现。






朱亚东博士,Mobvista 集团副总裁

作为十年的互联网老兵,他是前人民搜索技术创始人之一,之后就职阿里巴巴,先后担任手淘猜你喜欢、交易链路、天猫个性化推荐的算法负责人。并先后荣获阿里集团优秀算法、阿里巴巴集团 CEO 特别贡献奖。他在 ICDM、SIGIR、UAI、KDD 等世界顶级学术会议发表论文数十篇,并担任国内外多个顶级会议期刊审稿人。




今天的人工智能本质上等同于:<数据、平台、算法>的三元组。其中,大量实时产生的数据为人工智能的应用奠定了基础,通过大量数据可以训练人工智能的算法模型。与此同时,深度学习对并行计算及数据吞吐能力有更高的要求,GPU 等硬件的发展及计算能力的提升使得云计算平台可以快速计算处理大量数据。


最终,机器学习算法是实现人工智能落地的引擎,机器学习尤其是深度学习及强化学习的发展与迭代,进一步地促成了人工智能与商业场景的结合。


在这样的背景下,我们对汇量今天的人工智能现状及规划进行细粒度的介绍与剖析。




1

动态海量数据


汇量总体 DMP 数据已经累计 120 亿的设备信息,覆盖全球 200 多个国家,日活 7 亿。DMP 平台会把不同渠道的用户行为数据进行整理融合,这些渠道主要包含 Mintegral、GameAnalytics、DSP 等。海量数据为集团的人工智能发展提供了无限的可能性。


我们通过各维度的标签建设对海量用户数据进行画像和管理。通过对用户分层,建立一个自上而下,由粗到细的多级标签体系。


例如,用户是否命中游戏/电商/健康/社交/工具等某个或多个一级类目体系;然后针对如游戏的一级标签,进行游戏类型、题材、风格等的二级标签建设;接着,基于用户的行为特性,可以进行活跃、付费、粘性等三级标签体系的建设。此外,还提供如年龄、地域、性别、设备类型等丰富的横向维度的设备标签。




2

 高效计算平台


海量数据之上,是我们高效的数据计算处理平台体系,能支持海量数据的离线/在线处理计算。依托于 AWS 的各类基础服务组件,如 EC2、EMR、EBS 等,汇量实现了自有的计算调度、资源优化、存储优化等技术。



 具体来讲,包含三个层面的工作:

1) 首先提供了离线的高计算吞吐、高可用计算框架,支持计算隔离的多任务自主调度,以及 SLA 保障、集群动态扩展的计算处理需求;

2) 其次能提供高效可靠的在线服务,如百万+峰值秒级别的实时计算,及高性能的并行流式计算;

3) 最后,在完善的离线和在线数据服务能力的基础上,可以针对公司的不同层面的业务需求,提供一站式的数据分析及挖掘服务,配合前沿的算法体系,实现各种需求下的精准投放。


这些技术支持了目前公司业务上的大规模数据计算、工作流程调度,数据分析及机器学习模型的训练等,处于行业内前沿水准。




3

千人千面的智能投放体系


在数据、平台之上,汇量已经初步建立一套较为完善的千人千面的智能投放算法体系。简单来讲,可以针对一个设备及当前的上下文环境,进行最符合用户实时需求的广告投放,并以最能触达用户心智的素材创意进行投放展现。



这里面又包含了两个层次的算法体系。第一个层次被我们称为“人货场”的三位一体个性化。具体来讲,“人”指设备用户,“货”指待投广告候选,“场”指用户当前的活动场景。在这个层面,我们可以为每一个设备用户结合当前的上下文信息,找到最切合的信息(广告)需求。这背后是一套全面立体的 AI 投放算法体系,包括百亿级特征的广义线性模型和深度神经网络的深宽结合,以及实时高效的在线学习体系。



第二个层次是创意素材优选的个性化体系;即针对一个确定性的广告需求,如何以最能触达用户心智的素材创意进行投放展现。这里面又包含多维度和多层次的优化工作:个性化广告模版的生成、个性化素材的动态填充、优选组合呈现。


目前集团已成立了专门针对数字广告投放的创意实验室,针对各类广告形式设计开发全新的广告创意,包括 Playable、Interactive Endcard、AR/VR、全景视频等,然后结合前沿的算法框架,进行交互素材的自动化生成与制作。通过这个层次的个性化体系,能给用户带来极致的互动体验,能实现广告主、投放平台、流量的三方共赢。





4

其他纵向向算法体系


除了上面介绍的千人千面的个性化投放体系,针对广告数字领域,集团在一些垂直领域也做了较为深入的布局与规划,包括针对 DSP 场景的 Dynamic Pacing 竞价策略,以及基础的反欺诈技术框架体系。对于 DSP 场景,我们会结合精准的 eCPM 模型预估,制定一系列预算分配与消耗策略,实现最优竞价。


反欺诈系统通过机器学习方法,结合传统规则引擎,依托海量数据,利用大数据相关技术,在多环节(包括展现、点击、安装等)进行反欺诈的分析,分别在事前、事中和事后不同的节点采取对应措施。反欺诈系统能够为广告主挽回相当比例的预算损失,提升公司流量质量,为广告投放保驾护航。关于反作弊部分,我们在之前的文章中也有做过较为详细的介绍,欢迎大家再次翻阅。


写在最后


汇量虽已走过 5 年的历程,但 AI 赋能商业化的道路才刚刚开始。后续面临的挑战依然很大。令人振奋的是,越来越多的世界级人才认可并加入汇量。2018 年 1 月,前亚马逊中国首席架构师蔡超也加盟汇量,担任集团首席工程架构师。蔡超先生利用其丰富扎实的技术对集团各类基础工程架构已展开了优化重构,为集团的全球化布局,注入一道强心剂。


我们有理由相信,通过完善的商业布局和人工智能的规划,汇量在出海的道路上会越走越远。




相关推荐

剑桥分析盗用 Facebook 用户数据风波:复盘与预见

如何判断一款游戏是真的火了?火烧北美的“堡垒之夜”可以给你一点启发

学院派网红之路

"美国春晚"超级碗,今年的广告要上天

评论区观光客太多,社交平台要收割韭菜了

日本吃着中华鸡,中国遍布霓虹蛙

直播答题,灵长类动物的一次智力变现狂欢

手把手教你玩转Snapchat投放 | 2018解放生产力新招

年轻人追剧喜欢“暴食收看”,广告机会点在哪里? | 瞻前.2018

第一批智能手机用户已经开始戒手机了


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存